Udio et Suno, des IA de génération de musiques attaquées par l’industrie musicale américaine

Udio et Suno, des IA de génération de musiques attaquées par l’industrie musicale américaine

Je danse le IA

10

Udio et Suno, des IA de génération de musiques attaquées par l’industrie musicale américaine

Udio et Suno, deux startups d'IA générative spécialisées dans la musique font face à des plaintes de l'industrie musicale : l'association américaine des maisons de disque RIAA ainsi que Universal Music Group (UMG), Sony Music Entertainment et Warner Records les ont attaqués pour violation de copyright « en masse » et demandent 150 000 dollars par titre.

Deux startups Udio et Suno se sont lancées dans l'IA générative de musique avec un certain succès. Suno peut, par exemple, générer une chanson à partir d'un prompt avec un style de musique demandé et des paroles. Elle peut aussi générer elle-même des paroles en utilisant l'API d'OpenAI. Elles ont toutes les deux levé plusieurs millions de dollars et la valeur de Suno est évaluée à près de 500 millions de dollars.

Jusque-là, d'autres avaient déjà sorti des applications, mais elles ne donnaient pas de résultat probant. Comme l'explique le Youtubeur Florent Garcia, « la plupart des outils [...] n'étaient pas capables de faire des morceaux qui avaient une tonalité cohérente, une signature rythmique cohérente, des parties rythmiques qui auraient du sens ». Mais, ces deux applications se rapprochent de sons publiés par des majors de l'édition numérique.

Génération de morceaux très proches d'originaux

Comme l'explique le Youtubeur, ce rapprochement n'est sans doute pas un hasard et il est bien possible que leurs algorithmes aient été entrainés sur des musiques déjà existantes. Le site Music Business Wordwilde cité par Florent Garcia a pu générer des sons très proches d'originaux en créant des prompts assez simples.

Le média spécialisé dans l'industrie musicale explique sa démarche : « lorsqu'une entreprise d'IA ne révèle pas ses sources de données d'entraînement, la meilleure chance que nous ayons d'identifier ces sources est d'utiliser le modèle et de voir si nous pouvons trouver des résultats qui ressemblent à du matériel protégé par le Copyright. Un résultat qui ressemble à du contenu protégé par le Copyright est un indicateur fort que ce matériel faisait partie des données d'entraînement ».

Et ça n'a pas raté. Par exemple, avec un prompt comme « mainstream pop, ripped audio, aac », Suno leur a généré un son très proche de chansons d'Ed Sheeran (sans même évoquer l'artiste). Ils ont aussi pu obtenir une version de Dancing Queen d'Abba très proche de l'original en donnant les paroles de la chanson.

Si l'appli ne permet pas de demander directement de générer une chanson en citant le nom d'un interprète, Music Business WorldWilde a réussi à contourner facilement le filtre en utilisant soit un nom très proche comme « beminem » au lieu d'Eminem ou une paraphrase comme « a 90 s British band from Manchester » pour désigner Oasis.

Il y a donc des indices qui vont dans le sens d'une utilisation de musiques connues pour entrainer cette IA.

Un bras de fer juridique assumé par un des investisseurs de Suno

Dans un article de Rolling Stone publié en mars dernier, l'un des investisseurs de Suno, Antonio Rodriguez, partenaire de la société de capital-risque Matrix, assumait que l'entreprise pouvait être attaquée en justice par les maisons de disques : « le risque que nous avons dû assumer lorsque nous avons investi dans la société, parce que nous sommes le gros portefeuille qui sera poursuivi juste derrière ces gars….. Honnêtement, si nous avions eu des accords avec les labels lorsque cette société a démarré, je n'aurais probablement pas investi dans celle-ci. Je pense qu'ils avaient besoin de faire ce produit sans les contraintes ». Et, ce qui devait arriver arriva.

150 000 dollars par titre utilisé sans autorisation

The Verge explique dans un article publié ce lundi 24 juin qu'Universal Music Group (UMG), Sony Music Entertainment, Atlantic Recording, Rhino Entertainment, The All Blacks USA, Warner Records et la Recording Industry Association of America (RIAA, lobby des maisons de disque aux États-Unis), ont attaqué Suno et Udio séparément (.pdf de la plainte contre Suno, .pdf de la plainte contre Udio).

Dans ces plaintes, la RIAA demande un montant maximal de 150 000 dollars de dédommagement pour chaque titre utilisé sans autorisation. Le lobby considère que « selon les principes fondamentaux du Copyright, la copie d'enregistrements sonores protégés dans le but de développer un produit d'IA nécessite l'autorisation des titulaires de droits. Dans le cas contraire, ces offres d'IA éroderont la valeur des œuvres artistiques qui constituent les matières premières essentielles à leur fonctionnement ».

Dans les deux plaintes, on peut encore lire que « ce sur quoi [sont entrainés les services de Suno et Udio] est évident. [Suno et Udio ont] copié en masse les enregistrements sonores protégés par le droit d'auteur des plaignants et les [ont] intégré dans [leurs modèles] d'IA ».

La plainte contre Suno donne l'exemple du titre « Deep down in Louisiana close to New Orle » généré par l'appli et Johnny B. Goode de Chuck Berry. Celle contre Udio pointe le titre « Sunshine Melody » (maintenant retiré du site) et My Girl du groupe The Temptations.

Les discussions n'ont pas abouti

La RIAA se plaint qu'Udio n'a pas voulu lui laisser vérifier sa base de données d'entrainement et lui a expliqué qu'elle représentait un secret commercial, « bien qu'elle soit établie à partir de la musique "publiquement disponible" pour les fans de musique ». De la même manière, Suno lui a répondu que sa base de données de musique était une information commerciale confidentielle.

Dans un communiqué envoyé à The Verge, Suno qualifie sa technologie de « transformatrice » et conçue pour « générer des résultats totalement nouveaux, et non pour mémoriser et régurgiter des contenus préexistants ». Le CEO de l'entreprise, Mikey Shulman, y reproche aux grandes maisons de disques de ne pas avoir une discussion franche.

Après le texte et les images, la musique est maintenant entrée dans une période de conflits juridiques entre maisons de disques et startup d'IA générative.

Commentaires (10)


On attend avec impatience les premières décisions de justice qui feront jurisprudence. Ça mettra un coup d'arrêt à tous ces modèles ou, au contraire, ça en ferra naitre toute une myriade.
Modifié le 25/06/2024 à 17h33

Historique des modifications :

Posté le 25/06/2024 à 17h33


On attend avec impatience les premières décisions de justice qui feront jurisprudence. Ça mettra un coup d'arrêt à tous ces modèles ou, au contraire, ça en ferra naitre toute une myriade.

Ça ne mettrait probablement pas un coup d'arrêt à ces modèles, mais ça pourrait les obliger à trouver des accords commerciaux avec les détenteurs de droits.
Je préfère Hatsune Miku, c'est bien plus "humain".
Peut-être parce que les créatifs le sont, et qu'ils laissent les ordinateurs à leur place d'outils...
Pour l'instant, niveau qualité, ça permet de faire des trucs corrects pour un projet perso ou de toute façon, tu n'aurais pas mis un rond sur la musique. Typiquement, je discute avec un mec qui fait un petit jeu à la con pour lui et ses potes sur un délire. Il va très certainement utiliser suno pour les musiques. C'est bien pour des petits trucs drôles entre potes, mais dans l'immédiat, ça ne concurrence que le vomitif auriculaire.

Tiens, au passage, Hatsune Miku, je me demande si elle n'a pas été mise à jour ou si elle a toujours cette voix synthétique ?
Hatsune Miku Vocaloid
:cap:

edit: vocaloid est bien plus chiant a utiliser dans la mesure ou il faut que tu crée la musique toi-même, alors qu'avec ces 2-là, t'a juste besoin des textes et il te dégurgite une musique complète avec plus ou moins d'hallucinations
Modifié le 25/06/2024 à 22h36

Historique des modifications :

Posté le 25/06/2024 à 22h34


Hatsune Miko Vocaloid
:cap:

Posté le 25/06/2024 à 22h35


Hatsune Miku Vocaloid
:cap:

Albirew

Hatsune Miku Vocaloid
:cap:

edit: vocaloid est bien plus chiant a utiliser dans la mesure ou il faut que tu crée la musique toi-même, alors qu'avec ces 2-là, t'a juste besoin des textes et il te dégurgite une musique complète avec plus ou moins d'hallucinations
:cap:


edit: vocaloidVocaloid est bien plus chiant aà utiliser dans la mesure ouoù il faut que tu créecrées la musique toi-même, alors qu'avec ces 2-là, t'aas juste besoin des textes et il te dégurgite une musique complète avec plus ou moins d'hallucinations

miles67div

:cap:


edit: vocaloidVocaloid est bien plus chiant aà utiliser dans la mesure ouoù il faut que tu créecrées la musique toi-même, alors qu'avec ces 2-là, t'aas juste besoin des textes et il te dégurgite une musique complète avec plus ou moins d'hallucinations
Ce n'est clairement pas le même usage. Un Vocaloid, c'est un synthétiseur (petit détail : Les couleurs d'Hatsune Miku, ainsi que d'autre détail comme ses manches sont des références au Yamaha DX7 et DX100). La voix est ici réduite à un simple instrument de synthèse. Si tu ne sais pas faire de la musique avec un instrument, que ce soit un piano ou une voix synthétique, tu n'iras pas bien loin. Il faut que tu saches composer avant. C'est un outil pour un compositeur.

Ici, Suno c'est ton petit compositeur perso qui va suivre tes instructions pour faire une musique.
Autant, je ne peux rien dire pour Ed Sheeran tant je ne le connais pas, autant le "prancing queen" je n'ai pas entendu de "Dancing queen" dans le son. Ça a un air disco similaire à ABBA, mais pas plus. J'imagine qu'avec le succès du groupe, c'est un style qui a pullulé dans ces années-là.
En même temps, il n'y a rien qui ressemble plus à un tube disco qu'un autre tube disco. Alors forcément, si tu utilises les mêmes paroles, ça peut attirer l'oreille. Comme avec Johnny B Good, dans ce genre de musique, les grilles d'accords sont souvent les mêmes (sinon, Marty McFly n'aurait pas pu le jouer sur scène dans les années 50 avec un groupe qui ne connaissait pas la chanson :-D).

Mais le problème est ailleurs. Ce n'est pas la ressemblance qui pose problème, c'est qu'ils aient utilisé des contenus protégés pour entraîner leur I.A. sans le dire et sans accords des ayants droit. Bon, on est d'accord, la plupart sont des rapaces, mais là, je pense qu'ils sont quand même un peu dans leur droit...

Et puis, déjà que la musique mainstream actuelle donne l'impression d'être formatée par une I.A., alors ils ont peur de la concurrence :roule:
Modifié le 26/06/2024 à 09h20

Historique des modifications :

Posté le 26/06/2024 à 09h20


En même temps, il n'y a rien qui ressemble plus à un tube disco qu'un autre tube disco. Alors forcément, si tu utilises les mêmes paroles, ça peut attirer l'oreille. Comme avec Johnny B Good, dans ce genre de musique, les grilles d'accords sont souvent les mêmes (sinon, Marty McFly n'aurait pas pu le jouer sur scène dans les années 50 avec un groupe qui ne connaissait pas la chanson :-D).

Mais le problème est ailleurs. Ce n'est pas la ressemblance qui pose problème, c'est qu'ils aient utilisé des contenus protégés pour entraîner leur I.A. sans le dire et sans accords des ayants droit. Bon, on est d'accord, la plupart sont des rapaces, mais là, je pense qu'ils sont quand même un peu dans leur droit...

Et puis, déjà que la musique mainstream actuelle donne l'impression d'être formatée par un I.A., alors ils ont peur de la concurrence :roule:

Cyber-n-Ethique

En même temps, il n'y a rien qui ressemble plus à un tube disco qu'un autre tube disco. Alors forcément, si tu utilises les mêmes paroles, ça peut attirer l'oreille. Comme avec Johnny B Good, dans ce genre de musique, les grilles d'accords sont souvent les mêmes (sinon, Marty McFly n'aurait pas pu le jouer sur scène dans les années 50 avec un groupe qui ne connaissait pas la chanson :-D).

Mais le problème est ailleurs. Ce n'est pas la ressemblance qui pose problème, c'est qu'ils aient utilisé des contenus protégés pour entraîner leur I.A. sans le dire et sans accords des ayants droit. Bon, on est d'accord, la plupart sont des rapaces, mais là, je pense qu'ils sont quand même un peu dans leur droit...

Et puis, déjà que la musique mainstream actuelle donne l'impression d'être formatée par une I.A., alors ils ont peur de la concurrence :roule:
Ce n'est pas aussi simple et il y a des arguments qui vont dans l'autre sens :

Le modèle apprend et s'inspire des œuvres qu'il a entendus de la même manière que tous les artistes. Dire alors qu'il est illégal d'apprendre à faire de la musique en écoutant de la musique, c'est dire alors que tous les artistes sont dans l'illégalité.

Il est courant pour un artiste de dire qu'ils se sont inspiré de tel ou tel autre artiste sans qu'on leur saute dessus.

Je suis sûr que tu es capable de fredonner "Dancing Queen", et si tu avais des connaissances dans la composition musicale, tu aurais même eu les clés pour décortiquer la musique, souvenir de sa composition et reproduire quelque chose de très similaires si on t'avait demandé de le faire.

De la même manière, le modèle ne possède aucune copie de l'œuvre originale. Il a tout au plus une vague trace de sa composition. Avec les bonnes instructions, il est alors capable de créer quelque chose qui peut rappeler l'œuvre d'origine. C'est pour ça que le "Prancing Queen" a une petite vibes à la ABBA, mais n'est pas une copie du hit (loin de là, à côté, j'avais demandé à Dall-E de me faire une Joconde, j'avais déjà une image qui ressemblait à la Joconde).
Fermer